Większość kolumn opisuje się samo i zrozumiale, warto jednak sprawdzić, czym są FFMC, DMC, DC, ISI pochodzące z FWI (Fire Weather Index). Znaczenia tych indeksów pochodzą ze strony https://www.nwcg.gov/publications/pms437/cffdrs/fire-weather-index-system

Widzimy, że nasza ramka danych nie zawiera żadnych braków danych - poiwnno nas to cieszyć.

Rozkłady zmiennych

Korelacje zmiennych

Nie widać zbyt wielu korelacji, ale może warto zwrócić uwagę na:

Właściwie nie widać żadnych korelacji zmiennej "area_log" (z wyjątkiem z samą sobą i area). Widać nastomiast korelacje korelacje pomiędzy wartościami z kolumn month, FFMC, DMC, DC, ISI i temp. Spróbujemy jeszcze tę korelację pokazać na dokładniejszych wykresach.

Pandas profiling

Narzędzie pandas-profiling wydaje się być bardzo przydatnym, przynajmniej żeby na początku przyjrzeć się danym i podstawowym korelacjom. Ciekawe i na pewno przydatne są wyświetlane warningi, poza tym mamy wykresy korelacji oraz interaktwną sekcje, w której możemy wyświetlić scatterplot dowolnych dwóch zmiennych (gdzie wadą jest brak podglądu kilku wykresów jednocześnie - można wyświetlać tylko jeden w danym momencie). Ogólnie narzędzie to robi dużo podstaw do dalszej pracy, często będą potrzebne różne modyfikacje (tak jak np. używaliśmy logarytmu z powierzchni, zamiast samej powierzchni).